Demografi: opgaver 7

Opgave 1

Del 1

  1. Find register DODA1 i browseren: https://www.statistikbanken.dk/. Hvorfor angiver man alderstrin 0-1 separat fra alderstrin 1-4?
  • Spædbarnsdødelighed.

Del 2

  1. Find antal mænd og kvinder, som døde på grund af psykiske lidelser i 2018. Beregn de summariske årsagsspecifikke mortalitetsrater separat for mænd og kvinder (årsag = psykiske lidelser).
  • Kig under FOLK1A og DODA1 i statistikbanken, sæt årstal til 2018, angiv både mænd og kvinder og for DODA1 vælg årsag = A06.
  • Kvinder: 2313/2908,337 = 0,80 per 1000 personår
  • Mænd: 1556/2881,620 = 0,54 per 1000 personår

Del 2 - R-kode

dpl <- hent_data("doda1"rsag = "A06",tid = 2018,køn = 1:2,alder = "TOT") %>% 
  rename(antal_dod_psyk = INDHOLD) %>% 
  select(antal_dod_psyk,KØN)
N <- hent_data("folk1a",tid = "2018K3",køn = c(1:2),alder = "Alder i alt") %>%
  rename(R = INDHOLD) %>% 
  select(R,KØN)
dt <- left_join(dpl,N,by = "KØN") %>% 
  mutate(rate = 1000*antal_dod_psyk/R)
library(gt)
dt %>% 
  gt() %>% 
  fmt_number(columns = 4, decimals = 2, locale = "da") %>% 
  fmt_number(columns = c(1,3), decimals = 0, locale = "da")
antal_dod_psyk KØN R rate
1.556 Mænd 2.881.620 0,54
2.313 Kvinder 2.908.337 0,80

Del 3

  1. Hvorfor er det ikke helt fair at sammenligne mænd og kvinder med hensyn til de summariske rater af dødsfald på grund af psykiske lidelse?
  • Fordi kvinder bliver ældre end mænd, og dødsfald på grund af en psykiske lidelse forekommer hyppigt blandt ældre mennesker.

Del 4

  1. Brug tal fra statistikbanken til at beregne aldersstandardiserede rater af dødsfald på grund af psykiske lidelser, via direkte standardisering, separat for kvinder og mænd. Standardiser begge rater med hensyn til aldersfordelingen af alle danskere i 2018. Rapporter resultaterne og diskuter forskellene mellem de summariske og de standardiserede rater.

Del 4 - fortsat

Husk på formel (K2.9) \[\tilde{M}_S^{Q,A}=\sum_{x=1}^m M_x^{Q,A} V_x^S.\]

Del 4 - fortsat

  1. \(M_x^{Q,A}\) = antal døde i aldersintervallet \(x\) (for \(A\)=Mænd og \(A\)=Kvinder) i 2018 og dødsårsag \(Q\)=A06. Kan findes som \[ M_x^{Q,A} = \frac{D^{Q,A}_x}{R_x^A}, \] hvor \(D^{Q,A}_x\) er antal døde i aldersintervallet \(x\) og for gruppe \(A\) i 2018 og \(R_x^A\) er risikotiden i aldersintervallet \(x\) og køn \(A\) i 2018. Husk på, at vi bruger metode 1.

Del 4 - fortsat

  1. \(V_x^S\) = andel af risikotiden i aldersintervallet \(x\) i standardbefolkningen (hele Danmark) i 2018. \[ V_x^S = \frac{R_x^S}{\sum_{x=1}^m R_x^S}. \]

Del 4 - R-kode

# antal doede pga psykiske lidelser
dpl <- hent_data("doda1"rsag = "A06",tid = 2018,køn = 1:2,alder = "all_no_total")
# omdoeb INDHOLD og alder til antal_dod_psyk og aldersinterval
dpl <- rename(dpl,antal_dod_psyk = INDHOLD,aldersinterval = alder)
# begræns til variable som skal bruges
dpl <- select(dpl,aldersinterval,antal_dod_psyk,KØN)
# middelfolketal begge køn og også total
N <- hent_data("folk1a",tid = "2018K3",køn = c(1:2,"TOT"),alder = "all_no_total")
# metode 1 giver riskotid
N <- rename(N,R = INDHOLD)

# kategorisere i samme intervaller som data dpl
R <- intervAlder(N,breaks = c(0,1,seq(5,85,5),Inf),right = FALSE,by = "KØN",vars = "R",label_last = "85")
# beregn aldersfordeling af risikotid bland alle dansker
V <- filter(R,KØN == "I alt") %>% mutate(V=R/sum(R)) %>% select(aldersinterval,V) #ad 2
# join vægte med køn-specifik risikotid
dat <- filter(R,KØN != "I alt") %>% left_join(V,by = "aldersinterval")
# 
dat <- left_join(dpl,dat,by = c("aldersinterval","KØN"))
# 
# Direkte standardisering
#
# 1. beregn aldersspecifikke rater
dat <- mutate(dat,rate_dod_psyk =  1000*antal_dod_psyk/R) #ad 1
# 2. beregn alderstandardiserede rater
dt <- dat %>% group_by(KØN) %>% summarise(std_cause_mrate = sum(rate_dod_psyk*V)) #ad sum
library(gt)
dt %>% gt() %>% fmt_number(columns = 2, decimals = 3, locale = "da")
KØN std_cause_mrate
Kvinder 0,651
Mænd 0,659

Kommentarer

  • Aldersstandardiserede rater af dødsfald (psykisk lidelse; standardbefolkning: den danske befolkning) i 2018 var 0,659 per 1000 personår for mænd og 0,651 per 1000 personår for kvinder. De er altså næsten ens, så forskellen kunne nok godt forklares med at der var en forskel i aldersfordelingen.

Opgave 2

Del 1

  1. Hvordan giver følgende udsagn mening? Tabelbefolkningen bliver født og lever hele deres liv i et år.
  • Det giver mening, hvis man har beregnet dødelighedstavlen baseret på aldersspecifikke mortalitetsrater som gælder i dag. En ‘person’ fra tabelbefolkningen bliver ‘udsat’ for alle dødshyppigheder på tværs af alle aldersintervaller.

Del 2

  1. I figuren ovenfor, er antal personer som dør af kræft højere i aldersintervallet 5-9 end i aldersintervallet 45-49?

Del 2 - fortsat

  • Kan ikke afgøres ud fra figuren. Her ses kun relativt antal døde.

Del 3

  1. Fortolk alle tal i rækken for aldersintervallet 70-74 år i den årsagsspecifikke dødelighedstavle, hvor mænd i Danmark i 2018 nedenfor (dødsårsagen er kræft, se forelæsningsnoterne).
Alder \(\ell_x\) \({}_kd_x\) \({}_kd_x^{\text{Kraeft}}\) \(\operatorname{LTR}_x^{\text{Kraeft}}\) \(_xq^{\text{Kraeft}}_0\) \(o_x\)
70-74 80072 9391 3734 25,33 10,22 70,68
  • Fortolkning som i delopgave 1; de lever hele deres liv i et år.

Del 3 - fortsat

  • \(\ell_x\): I starten af aldersintervallet 70-74 er 80072 ‘personer’ (70,68%) fra tabelbefolkningen i live.
  • \({}_kd_x\): I intervallet dør 9391.
  • \({}_kd_x^{\text{Kraeft}}\): 3734 dør af kræft.
  • \(\operatorname{LTR}_x^{\text{Kraeft}}\): Risikoen for at dø af kræft i resten af livet er 25,33%, når man er blevet 70.
  • \(_xq^{\text{Kraeft}}_0\): Risiko for kræftdød inden 70-års alderen er 10,22%.
  • \(o_x\): Sandsynligheden for at blive 70-år gammel er 70,68%.

Opgave 3

  1. Beregn aldersspecifikke mortalitetsrater af kræft i 2010 og 2020 baseret på data fra statistikbanken for mænd og plot resultatet.
  2. Beregn andel kræftdødsfald blandt døde og bagefter årsagsspecifikke dødelighedstavler for mænd i 2010 og 2020 i Danmark.

Opgaveformulering - fortsat

  1. Rapporter livstidsrisiko for dødsfald med kræft som dødsårsag i 2010 og i 2020 (danske mænd).
  2. Sammenlign 2010 og 2020 med hensyn til de aldersspecifikke rater af kræftdødsfald og risiko for at dø af kræft (danske mænd).

Opgave 3 - R-kode

x <- hent_dodsaarsag_data(tid = c(2010,2020), årsag =c("A02"), køn = "Mænd")
x <- mutate(x,M = Dod/R, Q_rate = 1000*QDod/R, hQ = QDod/Dod, TID = factor(TID)) #mortalitetsrater, kræftdødsrate, andel kræftdødsfald, TID skal være factor
# plot 
g = ggplot(x,aes(x = aldersinterval,y = Q_rate,group = TID,color = TID))+geom_line(linewidth = 1.3)
g

Pænere formatering

g <- g + theme_gray()+scale_colour_wsj("colors6")
g <- g+theme(axis.title.y = element_text(margin = margin(t = 0, r = 20, b = 0, l = 0)))
g <- g+theme(axis.title.x = element_text(margin = margin(t = 20, r = 0, b = 0, l = 0)))
g <- g+theme(text = element_text(size=15))
g <- g + ylab("Kræftdødsfaldsrate per 1000 personår")+xlab("Alder")
g

R - kode - Tavle for 2010

# Chiang's a og andel kræftdødsfald
x <- x %>% group_by(TID) %>% mutate(a = c(0.1,2,rep(2.5,17)),k = c(1,4,rep(5,17)), hQ = QDod/Dod)
tavle_2010 = filter(x,TID == 2010) %>% dodsaarsagtavle(mortalitet = "M", hQ = "hQ", alder = "aldersinterval", radix = 100000)
tavle_2010 %>% 
  gt() %>% 
  fmt_number(columns = c("l","d","L"), decimals = 0, locale = "da") %>% 
  fmt_number(columns = c("dQ","hQ","p","e","o","LTR_Q"), decimals = 2, locale = "da") %>%
  fmt_scientific(columns = c("q","qQ", "T","risiko_Q"), n_sigfig = 3, locale = "da")
Alder l d dQ hQ p q qQ L T e o LTR_Q risiko_Q
0 100.000 361 3,06 0,01 1,00 3,61 × 10−3 3,06 × 10−5 99.675 7,71 × 106 77,15 1,00 0,28 3,06 × 10−5
1-4 99.639 65 2,96 0,05 1,00 6,53 × 10−4 2,97 × 10−5 398.427 7,62 × 106 76,43 1,00 0,28 6,01 × 10−5
5-9 99.574 36 2,96 0,08 1,00 3,57 × 10−4 2,97 × 10−5 497.782 7,22 × 106 72,47 1,00 0,28 8,98 × 10−5
10-14 99.539 34 5,65 0,17 1,00 3,41 × 10−4 5,68 × 10−5 497.609 6,72 × 106 67,50 1,00 0,28 1,46 × 10−4
15-19 99.505 162 16,48 0,10 1,00 1,63 × 10−3 1,66 × 10−4 497.119 6,22 × 106 62,52 0,99 0,28 3,11 × 10−4
20-24 99.343 277 11,80 0,04 1,00 2,79 × 10−3 1,19 × 10−4 496.021 5,72 × 106 57,62 0,99 0,28 4,29 × 10−4
25-29 99.065 321 22,26 0,07 1,00 3,24 × 10−3 2,25 × 10−4 494.524 5,23 × 106 52,77 0,99 0,28 6,52 × 10−4
30-34 98.744 331 42,42 0,13 1,00 3,35 × 10−3 4,30 × 10−4 492.894 4,73 × 106 47,94 0,98 0,28 1,08 × 10−3
35-39 98.413 535 65,25 0,12 0,99 5,43 × 10−3 6,63 × 10−4 490.731 4,24 × 106 43,09 0,98 0,28 1,73 × 10−3
40-44 97.879 865 159,84 0,18 0,99 8,84 × 10−3 1,63 × 10−3 487.232 3,75 × 106 38,31 0,97 0,28 3,33 × 10−3
45-49 97.014 1.428 282,25 0,20 0,99 1,47 × 10−2 2,91 × 10−3 481.500 3,26 × 106 33,63 0,96 0,29 6,15 × 10−3
50-54 95.586 2.629 794,99 0,30 0,97 2,75 × 10−2 8,32 × 10−3 471.359 2,78 × 106 29,10 0,93 0,29 1,41 × 10−2
55-59 92.958 3.884 1.297,30 0,33 0,96 4,18 × 10−2 1,40 × 10−2 455.077 2,31 × 106 24,85 0,89 0,29 2,71 × 10−2
60-64 89.073 5.312 2.080,16 0,39 0,94 5,96 × 10−2 2,34 × 10−2 432.087 1,85 × 106 20,82 0,84 0,28 4,79 × 10−2
65-69 83.761 7.376 3.072,67 0,42 0,91 8,81 × 10−2 3,67 × 10−2 400.366 1,42 × 106 16,98 0,76 0,28 7,86 × 10−2
70-74 76.385 11.073 4.490,98 0,41 0,86 1,45 × 10−1 5,88 × 10−2 354.244 1,02 × 106 13,38 0,65 0,26 1,24 × 10−1
75-79 65.312 14.965 5.272,88 0,35 0,77 2,29 × 10−1 8,07 × 10−2 289.150 6,68 × 105 10,23 0,50 0,24 1,76 × 10−1
80-84 50.348 18.338 5.092,81 0,28 0,64 3,64 × 10−1 1,01 × 10−1 205.892 3,79 × 105 7,53 0,32 0,21 2,27 × 10−1
85 32.009 32.009 5.310,25 0,17 0,00 1,00 1,66 × 10−1 172.996 1,73 × 105 5,40 0,00 0,17 2,80 × 10−1

R - kode - Tavle for 2020

tavle_2020 = filter(x,TID == 2020) %>% dodsaarsagtavle(mortalitet = "M", hQ = "hQ", alder = "aldersinterval", radix = 100000)
tavle_2020 %>% 
gt() %>% 
  fmt_number(columns = c("l","d","L"), decimals = 0, locale = "da") %>% 
  fmt_number(columns = c("dQ","hQ","p","e","o","LTR_Q"), decimals = 2, locale = "da") %>%
  fmt_scientific(columns = c("q","qQ", "T","risiko_Q"), n_sigfig = 3, locale = "da")
Alder l d dQ hQ p q qQ L T e o LTR_Q risiko_Q
0 100.000 345 0,00 0,00 1,00 3,45 × 10−3 0,00 99.690 7,96 × 106 79,64 1,00 0,28 0,00
1-4 99.655 56 15,62 0,28 1,00 5,64 × 10−4 1,57 × 10−4 398.508 7,86 × 106 78,92 1,00 0,28 1,56 × 10−4
5-9 99.599 48 9,66 0,20 1,00 4,85 × 10−4 9,69 × 10−5 497.874 7,47 × 106 74,96 1,00 0,28 2,53 × 10−4
10-14 99.551 52 5,72 0,11 1,00 5,18 × 10−4 5,75 × 10−5 497.624 6,97 × 106 70,00 0,99 0,28 3,10 × 10−4
15-19 99.499 100 5,70 0,06 1,00 1,00 × 10−3 5,73 × 10−5 497.246 6,47 × 106 65,03 0,99 0,28 3,67 × 10−4
20-24 99.399 211 28,35 0,13 1,00 2,13 × 10−3 2,85 × 10−4 496.469 5,97 × 106 60,10 0,99 0,28 6,51 × 10−4
25-29 99.188 272 16,97 0,06 1,00 2,74 × 10−3 1,71 × 10−4 495.261 5,48 × 106 55,22 0,99 0,28 8,20 × 10−4
30-34 98.917 235 26,66 0,11 1,00 2,37 × 10−3 2,70 × 10−4 493.996 4,98 × 106 50,36 0,99 0,28 1,09 × 10−3
35-39 98.682 468 74,51 0,16 1,00 4,74 × 10−3 7,55 × 10−4 492.240 4,49 × 106 45,48 0,98 0,28 1,83 × 10−3
40-44 98.214 596 103,47 0,17 0,99 6,07 × 10−3 1,05 × 10−3 489.579 4,00 × 106 40,68 0,98 0,28 2,87 × 10−3
45-49 97.618 937 199,79 0,21 0,99 9,60 × 10−3 2,05 × 10−3 485.745 3,51 × 106 35,92 0,97 0,28 4,86 × 10−3
50-54 96.680 1.616 451,97 0,28 0,98 1,67 × 10−2 4,67 × 10−3 479.363 3,02 × 106 31,24 0,95 0,28 9,38 × 10−3
55-59 95.065 2.688 914,12 0,34 0,97 2,83 × 10−2 9,62 × 10−3 468.603 2,54 × 106 26,73 0,92 0,28 1,85 × 10−2
60-64 92.377 4.374 1.657,15 0,38 0,95 4,74 × 10−2 1,79 × 10−2 450.948 2,07 × 106 22,43 0,88 0,28 3,51 × 10−2
65-69 88.002 6.943 2.795,15 0,40 0,92 7,89 × 10−2 3,18 × 10−2 422.655 1,62 × 106 18,42 0,81 0,28 6,30 × 10−2
70-74 81.059 9.309 3.813,30 0,41 0,89 1,15 × 10−1 4,70 × 10−2 382.024 1,20 × 106 14,79 0,72 0,27 1,01 × 10−1
75-79 71.750 12.909 4.550,86 0,35 0,82 1,80 × 10−1 6,34 × 10−2 326.479 8,17 × 105 11,38 0,59 0,25 1,47 × 10−1
80-84 58.841 17.358 5.034,60 0,29 0,71 2,95 × 10−1 8,56 × 10−2 250.812 4,90 × 105 8,33 0,41 0,23 1,97 × 10−1
85 41.484 41.484 8.312,77 0,20 0,00 1,00 2,00 × 10−1 239.335 2,39 × 105 5,77 0,00 0,20 2,80 × 10−1

Opgave 3 - Besvarelse

  1. For dødshyppighed blandt døde (aldersspecifik) kig under hQ.
  2. Livstidsrisiko for at dø af kræft er 28,0% baseret på de årsagsspecifikke mortalitetsrater for mænd i Danmark fra 2010 og også 28,0% baseret på årsagsspecifikke mortalitetsrater for mænd i Danmark fra 2020.
  3. Se plot(s).

Ekstra plot

tavle_2010$Tid <- 2010
tavle_2020$Tid <- 2020
tavle_til_plot <- rbind(tavle_2010,tavle_2020)
tavle_til_plot$Tid <- as.factor(tavle_til_plot$Tid)
gg <- ggplot(tavle_til_plot,aes(x = Alder,y = LTR_Q,group = Tid,color = Tid))+geom_line(linewidth = 1.3)+ylab("Restlivstidsrisikoen for død af kræft")+xlab("Alder") + theme_gray()+scale_colour_wsj("colors6")+theme(axis.title.y = element_text(margin = margin(t = 0, r = 20, b = 0, l = 0)))+theme(axis.title.x = element_text(margin = margin(t = 20, r = 0, b = 0, l = 0)))+theme(text = element_text(size=15))
gg

Ekstra plot 2

ggplot(tavle_til_plot,aes(x = Alder,y = qQ,group = Tid,color = Tid))+geom_line(linewidth = 1.3)+ylab("Risikoen for at en nyfødt dør af årsag af kræft inden alder x")+xlab("x") + theme_gray()+scale_colour_wsj("colors6")+theme(axis.title.y = element_text(margin = margin(t = 0, r = 20, b = 0, l = 0)))+theme(axis.title.x = element_text(margin = margin(t = 20, r = 0, b = 0, l = 0)))+theme(text = element_text(size=15))

Kommentarer

  • Aldersspecifikke mortalitetsrater pga. kræft er højere i 2010 end i 2020 for midaldrende og ældre. Det samme er gældende for sandsynligheden for at en nyfødt dør af kræft inden alder x.
  • Alligevel er restlivstidsrisikoen for kræft generelt lavere i 2010 end i 2020.
  • Det skyldes at mortalitetsraterne for at dø af andet end kræft er mindre i 2020.